C-SAKey : une approche de découverte de clés conditionnelles dans des données RDF
نویسندگان
چکیده
Résumé : L’exploitation des liens d’identité entre ressources RDF permet aux applications de combiner des données issues de différentes sources. Les approches permettant de lier des données sont largement fondées sur l’existence de clés éventuellement composites. Ces clés étant rarement disponibles, des approches récentes se sont intéressées à la découverte automatique de clés à partir de données RDF. Cependant, dans certains domaines, les classes de l’ontologie sont très générales et les clés valides pour tout l’ensemble d’instances d’une classe sont peu nombreuses. Aussi, dans l’approche C-SAKey, nous proposons de détecter des clés conditionnelles qui ne s’appliqueront qu’à un sousensemble des instances d’une classe. Nous avons réalisé une première expérimentation sur un jeu de données de l’INA qui montre que les clés découvertes par notre approche peuvent effectivement varier selon les conditions exprimées dans la clé. Mots-clés : Intégration de données, Liens d’identité, Liage de données, Clés, RDF, OWL
منابع مشابه
Découverte de proportions analogiques dans les bases de données : une première approche
Résumé. Cet article présente un nouveau cadre pour la découverte de connaissances basé sur la notion de proportion analogique qui exprime l’égalité des rapports entre les attributs de deux paires d’éléments. Cette notion est développée dans le contexte des bases de données pour découvrir des parallèles dans les données. Dans un premier temps, nous donnons une définition formelle des proportions...
متن کاملDécouverte des dépendances fonctionnelles conditionnelles fréquentes
Résumé. Les Dépendances Fonctionnelles Conditionnelles (DFC) ont été introduites en 2007 pour le nettoyage des données. Elles peuvent être considérées comme une unification de Dépendances Fonctionnelles (DF) classiques et de Règles d’Association (RA) puisqu’elles permettent de spécifier des dépendances mixant des attributs et des couples de la forme attribut/valeur. Dans cet article, nous trait...
متن کاملDétection de clefs pour l'interconnexion et le nettoyage de jeux de données
Résumé : Cet article propose une méthode d’analyse de jeux de données du Web publiés en RDF basée sur les dépendances de clefs. Ce type particulier de dépendances fonctionnelles, largement étudié dans la théorie des bases de données, permet d’évaluer si un ensemble de propriétés constitue une clef pour l’ensemble de données considéré. Si c’est le cas, il n’y aura alors pas deux instances posséd...
متن کاملSPARQL Template : un langage de pretty printing pour RDF
RDF est un langage de représentation de connaissances basé sur des graphes étiquetés, conçu par le W3C pour le Web sémantique et le Web des données. En tant que langage d’échange pivot, il peut être utilisé pour représenter des arbres de syntaxe abstraite (AST) de langages. Par exemple le langage OWL a plusieurs syntaxes dont une syntaxe fonctionnelle et une syntaxe RDF, de même que le langage ...
متن کاملGraphes de voisinage pour l'indexation et l'interrogation d'images par le contenu
Résumé. La découverte d’informations cachées dans les bases de données multimédias est une tâche difficile à cause de leur structure complexe et à la subjectivité liée à leur interprétation. Face à cette situation, l’utilisation d’un index est primordiale. Un index multimédia permet de regrouper les données selon des critères de similarité. Nous proposons dans cet article d’apporter une amélior...
متن کامل